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Society dite : STMicroelectronics N.V. 



Proced€ et dispositif d'encodage de la parole k bande llargie 



Proc€de et dispositif d'encodage de la parole k bande eiargie. 



L'invention concerne l'encodage/decodage de la parole k 
bande eiargie, notamment mais non limitativement pour la tSMphonie 
mobile. 

En bande eiargie, la bande passante du signal de parole est 
comprise entre 50 et 7000 Hz. 

Des sequences de parole successives 6chantillonnees k une 
frequence d'echantillonnage pr^d^terminee, par exemple 16 kHz, 
sont traitdes dans un dispositif de codage de type CELP, utilisant 
une prediction lin6aire a excitation par sequences codees ( par 
exemple ACELP : « algebraic-code-excited linear-prediction »), bien 
connu de Fhomme du metier, et d6crit notamment dans ia 
recommandation ITU-TG 729, version 3/96, intitule « codage de la 
parole k 8 kbits/s par prediction lin6aire avec excitation par 
sequences codees a structure alg6brique conjugu€e ». 

On va maintenant rappeler briSvement, en se ref6rant k la 
figure 1, les principales caracteristiques et fonctionnalites d*un tel 
codeur, Thomme du metier pouvant se r€ferer k toutes fins utiles, 
pour plus de details* k la recommandation G 729 precit6e. 

Le codeur de prediction CD, du type CELP, est fonde sur le 
module de codage pr€dictif lin6aire k excitation par code. Le codeur 
opere sur des super-trames vocales equivalentes par exemple k 20 ms 
de signal et comportant chacune 320 echantillons. L'extraction des 
parametres de prediction lineaire, c*est-&-dire les coefficients du 
filtre de prediction lineaire egalement appeie filtre de synthese a 
court-terme 1/A(z), est effectuee pour chaque super-trame de parole. 
Par contre, chaque super-trame est subdivisee en trames de 5 ms 
comprenant 80 echantillons. Toutes les trames, le signal vocal est 
analyse pour en extraire les paramfetres du modele de prediction 
CELP (c'est-a-dire, notamment, un mot numerique d'excitation k 
long terme v t extrait d'un repertoire code adaptatif DLT, egalement 
denomme « dictionnaire a long terme adaptatif », un gain k long 
terme associe Ga, un mot d'excitation k court terme c jt extrait d'un 



repertoire code fixe DCT, egalement d<Snomm£ « dictionnaire a court 
terme », et un gain k court terme associe Gc). 

Ces paramfctres sont ensuite codds et transmis. 

A la reception, ces paramStres servent, dans un dScodeur, k 
r6cup6rer les parametres d'excitation et du filtre pr6dictif. On 
reconstitue alors la parole en filtrant ce flux d'excitation dans un 
filtre de synthase k court terme. 

Alors que le dictionnaire adaptatif DLT contient des mots 
nungriques repr£sentatifs de d£lais tonaux representatifs 
d'excitations passSes, le dictionnaire k court terme DCT est fond<§ 
sur une structure fixe, par exemple de type stochastique, ou de type 
algSbrique utilisant un mod&le de permutation entrelac£e 
d'impulsions de Dirac. Dans le cas d'une structure algSbrique, le 
repertoire code contient des excitations innovatrices Egalement 
appe!6es excitations algSbriques ou k court-terme, et chaque vecteur 
contient un certain nombre d'impulsions non nulles, par exemple 
quatre, dont chacune peut avoir l'amplitude +1 ou -1 avec des 
positions predetermines. 

Les moyens de traitement du codeur CD component 
fonctionnellement des premiers moyens d'extraction MEXT1 
destines a extraire le mot d'excitation k long terme, et des 
deuxifemes moyens d'extraction MEXT2 destines k extraire le mot 
d'excitation k court terme. Fonctionnellement, ces moyens sont 
realises par exemple de fa^on logicielle au sein d'un processeur. 

Ces moyens d'extraction comportent un filtre predictif FP 
ayant une fonction de transfert egale k 1/A(z), ainsi qu'un filtre de 
pond6ration perceptuel FPP ayant une fonction de transfert W(z). Le 
filtre de pondSration perceptuelle est applique au signal pour 
modeliser la perception de l'oreille. 

Par ailleurs, les moyens d'extraction comportent des moyens 
MECM destines a effectuer une minimisation d'une erreur carr^e 
moyenne. 

Le filtre de synthase FP de la prediction lineaire modeiise 
renveloppe spectrale du signal. L'analyse predictive lineaire est 



effectuee toutes les super-trames, de fagon k determiner les 
coefficients de filtrage predictif lineaire. Ceux-ci sont convertis en 
paires de lignes spectrales (LSP : « Line Spectrum Pairs ») et 
num6ris6s par quantification vectorielle predictive en deux etapes. 

Chaque super-trame de parole de 20 ms est divisee en quatre 
trames de 5 ms chacune contenant 80 echantillons. Les parametres 
LSP quantifies sont transmis au decodeur une fois par super-trame 
alors que les paramdtres a long terme et k court terme sont transmis 
k chaque trame. 

Les coefficients du filtre de prediction lineaire, quantifies et 
non quantifies, sont utilises pour la trame la plus recente d'une 
super-trame, tandis que les trois autres trames de la mSme super- 
trame utilisent une interpolation de ces coefficients. Le deiai tonal 
en boucle ouverte est estime par exemple toutes les deux trames sur 
la base du signal vocal pondere perceptuellement. Puis, les 
operations suivantes sont repetees k chaque trame : 

Le signal cible a long terme X LT est calcuie en filtrant le 
signal de parole echantillonne s(n) par le filtre de ponderation 
perceptuelle FPP. 

On soustrait ensuite du signal vocal pondere la reponse k 
entree nulle du filtre de synthese pondere FP, FPP, de fa?on k 
obtenir un nouveau signal cible long terme. 

La reponse impulsionnelle du filtre de synthase pondere est 
calcuie. 

Une analyse tonale en boucle fermee utilisant une 
minimisation de Terreur carree moyenne, est ensuite effectuee afin 
de determiner le mot d'excitation k long terme v { et le gain associe 
Ga, au moyen du signal cible et de la reponse impulsionnelle, par 
recherche autour de la valeur du deiai tonal en boucle ouverte. 

Le signal cible long terme est ensuite mis k jour par 
soustraction de la contribution filtree y du repertoire code adaptatif 
DLT et ce nouveau signal cible court terme X ST est utilise lors de 
l'exploration du repertoire code fixe DCT afin de determiner le mot 
d'excitation court terme Cj et le gain G c associe. hk encore, cette 



recherche en boucle ferm£e s'effectue par une minimisation de 
Ferreur carr£e moyenne. 

Finalement, le dictionnaire k long terme adaptatif DLT ainsi 
que les m^moires des filtres FP et FPP, sont mis k jour au moyen des 
mots d'excitation long terme et court terme ainsi determines. 

La quality d'un algorithme CELP depend fortement de la 
richesse du dictionnaire d' excitation k court terme DCT, par exemple 
d'un dictionnaire d'excitation algebrique. Si l'efficacite d'un tel 
algorithme est incontestable pour les signaux a bande passante 
Stroke (300-3400 Hz), des problemes surviennent pour des signaux k 
bande £largie. 

Les inventeurs ont en effet observe que meme avec un 
dictionnaire tr&s riche, 1'algorithme d'encodage de la parole produit 
deux types de problfcmes : 

1) une qualite globale de parole reconstruite totalement 
insuffisante (la parole reconstruite manque de presence, 
le niveau d'Snergie est trds variable, le timbre de la voix 
est m^connaissable, ...), 

2) un signal reconstruit corrompu par trois sortes de bruits : 

- un bruit harmonique en haute frequence (comb-like 
noise), 

- un fort bruit k haute frequence, tel un bruit de 
quantification, 

- un bruit en basse frequence (rumbling noise), tel qu'un 
balai de paille frappe k intervalles r£guliers sur le sol. 

II a alors 6t6 observe qu'une amelioration de la quality 
globale de la parole pouvait Stre obtenue par une elimination 
partielle ou totale de ces bruits. 

Un but de l'invention est de r£duire le bruit harmonique et le 
bruit haute frequence. 

L'invention a 6galement pour but de supprimer le bruit de 
type « sifflement » entachant les trames de parole vois£e. 

L'invention a encore pour but de contrdler independamment 
les distorsions k court terme et k long terme. 



L'invention propose done un procede d'encodage de la parole 
k bande eiargie, dans lequel on echantillonne la parole de fa?on k 
obtenir des trames vocales successives comportant chacune un 
nombre predetermine d'echantillons, et k chaque trame vocale, on 
determine des paramdtres d'un module de prediction lin^aire k 
excitation par code, ces param&tres comportant un mot numerique 
d'excitation k long terme extrait d'un repertoire code adaptatif et un 
gain k long terme associe, ainsi qu'un mot d'excitation k court terme 
extrait d'un dictionnaire k court terme et un gain k court terme 
associe, et on met k jour le repertoire code adaptatif k partir du mot 
d'excitation k long terme extrait et du mot d'excitation a court terme 
extrait. 

Selon une caracteristique generale de l'invention, on somme 
le produit du mot extrait d'excitation k long terme par le gain k long 
terme associe, avec le produit du mot extrait d'excitation k court 
terme par le gain a court terme associe, on filtre le mot numerique 
somme dans un filtre passe-bas ayant une frequence de coupure 
superieure au quart de la frequence d'echantillonnage et inferieure k 
la moitie de celle-ci, et on met k jour le repertoire code adaptatif 
avec le mot filtre. 

L'invention utilise ici un filtre « de correction totale » qui 
combine un filtre de correction du bruit harmonique et un filtre de 
correction haute frequence. 

L'invention permet ainsi une amelioration de la qualite 
durant les trames de parole voisees. Par ailleurs, la complexite de 
Tencodeur est reduite en fusionnant en un seul filtre le filtre de 
correction harmonique et le filtre de correction haute frequence. 

L'invention se distingue notamment d'une solution decrite 
dans un article de Kroon et Atal, intitule « Strategies for Improving 
the Performance of CELP Coders at Low Bit Rates », Proc, IEEE, 
Int. Conf. Acoustics, Speech, and Signal Processing, ICASSP'88, 
New York, USA, 1988, Pages 151-154, qui propose un filtrage du 
dictionnaire adaptatif effectue k la sortie de ce dictionnaire et non 
pas k l'entree conformement k l'invention. 
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Ainsi, le prSfiltrage du dictionnaire adaptatif selon 
Finvention prdsente par rapport au post-filtrage de Particle de 
Kroon et Atal, Favantage que le filtrage est pris en compte lors de la 
minimisation de Ferreur effectuSe pour choisir Fexcitation 
5 adaptative k la trame suivante. Ce n'est pas le cas pour la solution de 
Kroon et Atal, puisque le filtrage propose a lieu sur Fexcitation 
choisie. Aussi, pour tenir compte du filtrage dans la minimisation de 
Ferreur, il faudrait alors augmenter la complexity. 

Selon un mode de mise en ceuvre pr6f6rentielle, on filtre le 
10 mot somme avec un filtre num^rique k rdponse impulsionnelle finie a 
phase lineaire ayant un ordre au moins Sgal k 10. Par exemple, 
lorsque la frequence d*6chantiIIonnage est de 16 kHz, on peut 
choisir un filtre d'ordre 20 ayant une frequence de coupure de 
Fordre de 6 kHz. 

15 Bien que la quality de la parole soit ainsi am61ior6e, les 

trames de parole vois^es semblent encore corrompues par un bruit de 
type « sifflement ». Ce bruit de nature haute frequence provient de 
Fexcitation k court terme qui introduit des artefacts indesirables. 
Deux types de solutions pour rgsoudre ce probl&me ont d€jk 6t6 

20 proposes dans la literature. Un premier type de solution, d6crit par 
exemple 

dans Farticle de Gerson et Jasiuk, intitule « Techniques for 
Improving the Performance of CELP-Type Speech Coders », IEEE, 
Journal on Selected Areas In Communications, Vol. 10, N°5, Juin 
25 1992, pages 858-865, ou bien 

dans Farticle de Miki et autres, intitule « A Pitch 
Synchronous Innovation CELP (PSI-CELP) Coder for 2-4 kbit/s », 
Proc. IEEE Int. Conf. Acoustics, Speech, and Signal Processing, 
ICASSP'94, Adelaide, South Australia, 1994, Vol. II, pages 113- 
30 116, 

propose de rendre la contribution k court terme periodique. 
Un autre type de solution, decrit par exemple 
dans Farticle de Taniguchi Johnson et Ohta, intitule « Pitch 
Sharpening for Perceptually Improved CELP, and the Sparse-Delta 



Codebook for Reduced Computation », Proc. IEEE Int. Conf. 
Acoustics, Speech, and Signal Processing, ICASSP'91, Toronto, 
Canada, 1991, pages 241-244, ou 

dans Particle de Shoham, intitule « Constrained-Stochastic 
Excitation Coding of Speech At 4,8 kb/s », Advances in Speech 
Coding, B.S. Atal, V. Cuperman, and A. Gersho, Eds., Dordrecht, 
The Netherlands, Kluwer, 1991, pages 339-348, 

propose un contrdle de fa?on adaptative du gain k court 
terme. - 

L'invention propose 6galement une solution du type contrdle 
de gain, mais totalement diffgrente de celle d€crite notamment dans 
les articles de Taniguchi et autres et de Shoham. 

Plus precisement, selon un mode de mise en oeuvre de 
Tinvention, Fextraction du mot d'excitation k court terme comporte 
un filtrage num6rique de prediction lineaire et le proc£d£ comporte 
une mise k jour de l'etat du filtre de prediction lineaire avec le mot 
d'excitation k court terme filtre par un filtre dont le ou les 
coefficients dependent de la valeur du gain k long terme, de fa$on k 
affaiblir la contribution de l'excitation k court terme lorsque le gain 
de 1/excitation k long terme est superieur k un seuil predetermine, 
par exemple egal k 0,8. 

En d'autres termes, la solution selon Tinvention consiste ici 
a affaiblir la contribution de l'excitation k court terme si le gain de 
1' excitation a long terme est important. Cependant, c'est la 
contribution de l'excitation k court terme non affaiblie qui est 
stock<Se dans le dictionnaire adaptatif pour sa mise k jour. Ainsi, la 
reduction intervient seulement sur la sortie. Le fait de preserver la 
contribution k court terme ~ k stbcker est important, puisque la 
richesse du dictionnaire adaptatif est ainsi conservge pour les plus 
basses frequences. 

Bien entendu, la correction du gain doit 6galement etre 
appliquee lors de la reconstruction du signal au niveau du d£codeur. 
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Ce filtre peut etre d'ordre 0 ou bien d'ordre supSrieoir ou egal 
k 1. Dans ce dernier cas, le filtre d'ordre sup^rieur ou egal k 1 peut 
etre k rSponse impulsionnelle finie. 

Selon un mode de mise en oeuvre de Pinvention, dans lequel 
5 filtre est d'ordre 1 et sa fonction de transfert <5gale k B0+B1 z 1 , le 
premier coefficient BO du filtre est egal k l/(l+B.min(Ga,l)), et le 
deuxidme coefficient Bl du filtre est egal k 
B.min(Ga,l)/(l+B.min(Ga,l)), oil B est un nombre reel de valeur 
absolue inferieure k 1, Ga est le gain k long terme et min(Ga,l) 

10 d6signe la valeur minimale entre Ga et 1. 

Selon une autre variante de Pinvention, qui peut etre prise en 
combinaison ou bien independamment de la variante prec^dente, on 
effectue Pextraction du mot d'excitation a long terme en utilisant un 
premier filtre de ponderation perceptuelle comportant un premier 

15 filtre de ponderation formantique, et on effectue Pextraction du mot 
d'excitation k court terme en utilisant le premier filtre de 
ponderation perceptuelle cascade a un deuxifcme filtre de 
ponderation perceptuelle comportant un deuxieme filtre de 
pond£ration formantique. Le denominateur de la fonction de transfert 

20 du premier filtre de ponderation formantique est 6gal au numerateur 
du deuxieme filtre de ponderation formantique. 

Ainsi, selon cette variante, Putilisation de deux filtres de 
ponderation formantique diff6rents permet de contrdler 
independamment les distorsions k court terme et k long terme. Le 

25 filtre de ponderation k court terme est cascade au filtre de 
ponderation k long terme. En outre, le fait de lier le denominateur du 
filtre de ponderation k long terme au numerateur du filtre de 
ponderation k court terme permet de contrdler separement ces deux 
filtres et permet en outre une nette simplification lorsque ces deux 

30 filtres sont cascades. 

Bien entendu, lorsque cette variante est utilisee en 
combinaison avec la variante de controle de gain, il est prevu une 
mise k jour de Petat des deux filtres de ponderation perceptuelle 
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avec le mot d'excitation a court terme filtre par le filtre d'ordre 
superieur ou 6gal a 1. 

L'invention a egalement pour objet un dispositif d'encodage 
de la parole a bande eiargie, comportant 

-des moyens d'echantillonnage aptes a echantillonner la 
parole de facon a obtenir des trames vocales successives comportant 
chacune un nombre predetermine d'echantillons, 

-des moyens de traitement aptes a chaque trame vocale, a 
determiner des parametres d'un modele de prediction lineaire a 
excitation par code, ces moyens de traitement comportant des 
premiers moyens d' extraction aptes a extraire un mot numerique 
d'excitation a long terme d'un repertoire code adaptatif et a calculer 
un gain a long terme associe, et des deuxiemes moyens d'extraction 
aptes a extraire un mot d'excitation a court terme d'un repertoire 
15 code fixe et a calculer un gain a court terme associe, et 

-des premiers moyens de mise a jour aptes a mettre a jour le 
repertoire code adaptatif a partir du mot d'excitation k long terme 
extrait et du mot d'excitation a court terme extrait. Selon une 
caracteristique generate de l'invention, les premiers moyens de mise 
20 & jour component 

-des premiers moyens de calcul aptes a sommer le produit du 
mot extrait d'excitation a long terme par le gain a long terme 
associe, avec le produit du mot extrait d'excitation k court terme par 
le gain a court terme associe, de facon a deiivrer un mot numerique 
25 somme, et 

-un filtre passe-bas ayant une frequence de coupure 
superieure au quart de la frequence d'echantillonnage et inferieure a 
la moitie de celle-ci, et connect* entre la sortie des premiers moyens 
de calcul et le repertoire code adaptatif de facon a mettre a jour ce 
30 repertoire adaptatif avec le mot filtre. 

Selon un mode de realisation de l'invention, les premiers 
moyens d'extraction component un filtre numerique de prediction 
lineaire, et par le fait que le dispositif comporte des deuxiemes 
moyens de mise a jour aptes a effectuer une mise a jour de l'etat du 
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filtre de prediction linSaire avec le~mot d'excitation k court terme 
filtre par un filtre dont le ou les coefficients dependent de la valeur 
du gain k long terme, de fa9on k affaiblir la contribution de 
l'excitation a court terme lorsque le gain de l'excitation k long terme 
est sup^rieur k un seuil predetermine. 

Selon un autre mode de realisation de l'invention, les 
premiers moyens d'extraction comprennent un premier filtre de 
ponderation perceptuelle comportant un premier filtre de ponderation 
formantique, par le fait que les deuxiemes moyens d'extraction 
comprennent le premier filtre de ponderation perceptuelle cascade k 
un deuxiSme filtre de ponderation perceptuelle comportant un 
deuxiSme filtre de ponderation formantique, et par le fait que le 
denominateur de la fonction de transfert du premier filtre de 
ponderation formantique est egal au numerateur du deuxidme filtre 
de ponderation formantique. 

L'invention a egalement pour objet un terminal d'un systfeme 
de communication sans fil, par exemple un telephone mobile 
cellulaire, incorporant un dispositif tel que defini ci-avant. 

D'autres avantages et caracteristiques de l'invention 
apparattront a 1'examen de la description detailiee de modes de 
realisation et de mise en ceuvre, nullement limitatifs, et des dessins 
annexes, sur lesquels : 

-la figure 1, d6jk decrite, illustre schematiquement un 
dispositif d'encodage de la parole, selon Tart anterieur ; 

-la figure 2 illustre schematiquement un premier mode de 
realisation d'un dispositif d'encodage, selon Tinvention ; 

-la figure 3 illustre schematiquement un deuxifcme mode de 
realisation d'un dispositif d'encodage, selon l'invention, et la figure 
3a illustre schematiquement un mode de realisation d'un decodeur 
correspondant ; 

-la figure 4 illustre schematiquement un troisifeme mode de 
realisation d'un dispositif d'encodage, selon Finvention ; 

-la figure 5 illustre schematiquement un quatridme mode de 
realisation d'un dispositif d'encodage, selon l'invention ; et 
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-la figure 6 illustre sch6matiquement 1' architecture interne 
d'un telephone mobile cellulaire incorporant un dispositif de codage, 
selon l'invention. 

Le dispositif d'encodage, ou codeur, CD, selon l'invention, 
tel qu'illustr6 sur la figure 2, se distingue de celui de Tart anterieur 
comme illustre sur la figure 1 par le fait que les moyens MAJ de 
mise a jour du dictionnaire a long terme adaptatifs DLT component 
un filtre de correction totale FLCT connects entre la sortie d'un 
sommateur SM et l'entreVdu dictionnaire DLT. 

Les deux entries du sommateur SM recoivent respectivement 
le produit du mot extrait d'excitation a long terme V; par le gain a 
long terme associS Ga, et le produit du mot extrait d'excitation a 
court terme Cj par le gain associe Gc. 

Ce filtre de correction totale FLCT est un filtre passe-bas 
ayant d'une facon gen6rale une fr6quence de coupure supe>ieure au 
quart de la frequence d'6chantillonnage et infeneure a la moitig de 
celle-ci. 

Ce filtre est dans l'exemple decrit un filtre nume>ique a 
reponse impulsionnelle finie a phase lin^aire ayant un ordre au 
moins 6gal a 10. 

Plus precisement, lorsque la frequence d'6chantiIlonnage est 
de 16 kHz, on utilisera de presence une frequence de coupure de 
l'ordre de 6 kHz et un filtre d'ordre 20, ce qui realise un bon 
compromis entre la complexity de la m<5moire et la quality du signal 
vocal reconstitue\ 

Le bruit harmonique est introduit par la contribution de 
l'excitation a long terme et par la repetition d'echantillons pour des 
valeurs de la periode fondamentale (pitch) inferieures a la longueur 
d'une trame de parole, ici de 5 ms. Ce bruit est Sgalement present 
pour des valeurs de la periode fondamentale sup6rieures a la taille 
d'une trame. II est en outre U6 au gain adaptatif, extrait une seule 
fois par trame de parole. 

L'utilisation d'un filtrage passe-bas de la contribution a long 
terme est une solution pour reduire le bruit harmonique. 
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Par aiileurs, le bruit k haute frequence est introduit par des 
anciennes contributions k haute frequence du dictionnaire k court 
terme, pr^sentes dans le dictionnaire adaptatif. 

Pour eiiminer ce bruit haute frequence, on peut eiiminer les 
composantes r6siduelles k haute frequence du dictionnaire adaptatif, 
en utilisant un filtre de correction, et ceci avant de remettre k jour le 
dictionnaire. 

Le filtre de correction totale selon Tinvention realise done la 
double fonction de correction harmonique et de correction haute 
frequence. Ceci permet une amelioration de la quality durant les 
trames de parole vois6es. 

En outre, l'emplacement de ce filtre, c'est-£-dire en entree du 
dictionnaire adaptatif, permet de prendre en compte le filtrage lors 
de la minimisation de Terreur effectuee pour choisir 1'excitation 
adaptative de la trame de parole suivante. 

Dans le mode de realisation illustre sur la figure 3, le codeur 
CD comporte en outre des deuxifcmes moyens de mise k jour MAJ2 
aptes k effectuer une mise k jour de l'etat du filtre de prediction 
linSaire FP et de l'etat du filtre de pondSration perceptuelle FPP 
avec le mot d'excitation k court terme Cj filtre par un filtre que Ton 
a represent^ ici schematiquement par un gain Gc\ Ce filtre peut etre 
d'ordre 0 et son gain Gc* est inf€rieur au gain Gc. En variante, ce 
filtre peut etre k reponse impulsionnelle finie et d'ordre superieur ou 
egal k 1, avec pour cas particulier un filtre k reponse impulsionnelle 
finie d'ordre 1. 

Les coefficients de ce filtre d'ordre 1 dependent de la valeur 
du gain k long terme Ga, de fa9on k affaiblir la contribution de 
1'excitation k court terme lorsque le gain de 1'excitation k long terme 
Ga est superieur k un seuil predetermine, par exemple egal k 0,8. 

La fonction de transfert de ce filtre est egale k B0+B1 z" 1 . A 
titre d'exemple, le premier coefficient du filtre BO peut etre 
determine par la formule (I) ci-dessous. 



1/(1 + 0,98 min (Ga, 1)) 



(I) 
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tandis que le deuxieme coefficient du filtre Bl peut gtre determine 
par la formule (II) ci-dessous. 

0,98 min (Ga, 1) / (1 + 0,98 min (Ga, 1)) (II) 

Par contre c'est bien la contribution k court terme non 
affaiblie (gain Gc) qui est stockle dans le dictionnaire adaptatif DLT 
pour sa mise a jour. - 

Ainsi, l'affaiblissement intervient uniquement sur le signal 
de sortie et le fait de preserver la contribution k court terme a 
stocker permet de conserver la richesse du dictionnaire adaptatif 
pour les plus basses frequences. 

Naturellement, la correction du gain Gc doit 6tre 6galement 
appliquee pour la mise k jour de l'<£tat des miSmoires des filtres dans 
le dScodeur DCD, comme illustre sch^matiquement sur la figure 3a. 

La variante de realisation illustree sur la figure 3 permet, 
outre les avantages apport<Ss par le filtre de correction totale, 
d'eliminer le bruit de type sifflement sur les trames de parole 
vois6es. 

Le filtre de pond6ration perceptuelle FPP exploite les 
propriety de masquage de Toreille humaine par rapport a 
Tenveloppe spectrale du signal de parole, dont la forme est fonction 
des resonances du conduit vocal. Ce filtre permet d'attribuer plus 
d'importance a Ferreur apparaissant dans les vallees spectrales par 
rapport aux pics formantiques. 

Dans les variantes illustnSes sur les figures 2 et 3, le mSme 
filtre de ponddration perceptuelle FPP est utilise pour la recherche k 
court terme et pour celle k long terme. La fonction de transfert W(z) 
de ce filtre FPP est donnee par la formule (III) ci-dessous. 



(///) 
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dans laquelle 1/A(z). est la fonction de transfert du filtre prSdictif EE. 
et yl et y2 sont les coefficients de ponderation perceptuelle, les deux* 
coefficients etant positifs ou nuls et inferieurs ou egaux k 1 avecle 
coefficient yl inferieur ou egal au coefficient yl. 

D'une fa^on generate, Ie filtre de ponderation perceptuelle 
est constitu6 d'un filtre de ponderation formantique et d'un filtre de 
ponderation de la pente de Tenveloppe spectrale du signal (tilt). 

Dans le cas present, on supposera que le filtre de ponderation 
perceptuelle est uniquement forme du filtre de ponderation 
formantique dont la fonction de transfert est donnee par la formule 
(III) ci-dessus. 

Or, la nature spectrale de la contribution a long terme est 
differente de celle de la contribution k court terme. Par consequent, 
il est avantageux d'utiliser deux filtres de ponderation formantique 
differents, permettant de contrdler independamment les distorsions k 
court terme et k long terme. 

Un tel mode de realisation est iliustre sur la figure 4, dans 
laquelle, par rapport k la figure 3, le filtre unique FPP a ete 
remplace par un premier filtre de ponderation formantique FPP1 
pour la recherche k long terme, cascade avec un deuxieme filtre de 
ponderation formantique FPP2 pour la recherche k court terme. 

Puisque le filtre de ponderation k court terme FPP2 est 
cascade au filtre de ponderation k long terme, les filtres apparaissant 
dans la boucle de recherche long terme doivent aussi apparaitre dans 
la boucle de recherche court terme. 

La fonction de transfert W x (z) du filtre de ponderation 
formantique FPP1 est donnee par la formule (IV) ci-dessous. 

MzlY n) 

tandis que la fonction de transfert W 2 (z) du filtre de ponderation 
formantique FPP2 est donnee par la formule (V) ci-dessous. 
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Par ailleurs, le coefficient y l2 est egal au coefficient y 21 . Ceci 
permet une nette simplification lorsqu'on cascade ces deux filtres. 
Ainsi, le filtre equivalent a la cascade de ces deux filtres a une 
fonction de transfert donn^e par la formule (VI) ci-dessous. 

— — (vn . . 



Par ailleurs, si Ton utilise la valeur 1 pour le coefficient y u , 
alors le filtre de synthese FP (ayant la fonction de transfert 1/A(z)) 
suivi du filtre de pond<Sration a long terme FPP1 et du filtre de 
ponderation FPP2 equivaut alors au filtre dont la fonction de 
transfert est donn<5e par la formule (VII) ci-dessous. 



(V//) 



Ce qui r€duit encore consid6rablement la complexity de 
l'algorithme d' extraction des excitations. 

A titre indicatif, on peut par exemple utiliser pour les 
coefficients Yu. Y 21 = Yt 2 et y 22 , les valeurs respectives 1 ; 0,1 et 0,9. 

Bien entendu, la variante prevoyant Tutilisation de deux 
filtres formantiques diffe>ents peut etre utilisee inddpendamment de 
celle prevoyant I'affaiblissement de la contribution a court terme. 

Un tel mode de realisation est illustrg sur la figure 5, ou Ton 
voit que l'utilisation des deux filtres formantiques est prise en 
combinaison avec l'utilisation du filtre de correction totale. 

L'invention s'applique avantageusement a la tdlephonie 
mobile, et en particulier a tous terminaux distants appartenant a un 
systeme de communication sans fil. 

Un tel terminal, par exemple un telephone mobile TP, tel que 
celui illustr6 sur la figure 6, comporte de facon classique une 
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antenne reliee par Finterm^diaire d'un duplexeur DUP h une chaTne 
de reception CHR et & une chaine de transmission CHT. Un 
processeur en bande de base BB est relie respectivement k la chaine 
de reception CHR et a la chaine de transmission CHT par 
FintermSdiaire de eonvertisseurs analogiques num^riques CAN et 
numeriques analogiques CNA. 

Classiquement, le processeur BB effectue des traitements en 
bande de base, et notamment un d6codage de canal DCN, suivi d'un 
d6codage de source DCS. 

Pour remission, le processeur effectue un codage de source 
CCS suivi d'un codage de canal CCN. 

Lorsque le telephone mobile incorpore un codeur selon 
Finvention, celui-ci est incorpor^ au sein des moyens de codage de 
source CCS, tandis que le decodeur est incorporS au sein des moyens 
de decodage de source DCS, 



REVINDICATIONS 



1- Procede d'encodage de la parole k bande elargie, dans lequel 
on echantillonne la parole de fafon k obtenir des trames vocales 
successives comportant chacune un nombre predetermine 
d'echantillons, et a chaque trame vocale on determine des param&tres 
d'un modele de prediction lineaire k excitation par code, ces 
paramfetres comportant un mot numerique d'excitation k long terme 
(Vi) extrait d'un repertoire code adaptatif (DLT) et un gain k long 
terme associe (Ga), ainsi qu'un mot d'excitation k court terme (cj) 
extrait d'un repertoire code fixe (DCT) et un gain k court terme 
associe (Gc), et on met k jour le repertoire code adaptatif k partir du 
mot d'excitation k long terme extrait et du mot d'excitation k court 
terme extrait, caracterise par le fait qu'on somme (SM) le produit du 
mot extrait d'excitation k long terme par le gain a long terme associe, 
avec le produit du mot extrait d'excitation k court terme par le gain k 
court terme associe, on filtre le mot numerique somme dans un filtre 
passe-bas (FLCT) ayant une frequence de coupure superieure au quart 
de la frequence d'echantillonnage et inferieure k la moitie de celle-ci, 
et on met k jour le repertoire code adaptatif avec le mot filtre. 

2- Procede selon la revendication 1, caracterise par le fait qu'on 
filtre le mot somme avec un filtre numerique (FLCT) k reponse 
impulsionnelle finie a phase lineaire ayant un ordre au moins egal a 
10. 

3- Procede selon la revendication 2, caracterise par le fait que 
la frequence d'echantillonnage est de 16 kHz, et par le fait que le 
filtre (FLCT) est un filtre d'ordre 20 ayant une frequence de coupure 
de 1' ordre de 6 kHz. 

4- Procede selon l'une des revendications precedentes, 
caracterise par le fait que 1'extraction du mot d'excitation k court 
terme comporte un filtrage numerique de prediction lineaire (FP), et 
par le fait que le precede comporte une mise k jour de 1'etat du filtre 
de prediction lineaire avec le mot d'excitation k court terme filtre par 
un filtre (Gc') dont le ou les coefficients dependent de la valeur du 
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gain k long terme, de fa?on k affaiblir la contribution de l'excitation a 
court terme lorsque le gain de l'excitation a long terme est superieur a 
un seuil predetermine. 

5- Procede selon la revendication 4, caracterise par le fait que 
le seuil predetermine est egal k 0,8. 

6- Procede selon la revendication 5, caracterise par le fait que 
le filtre est d'ordre 1 et a une fonction de transfert egale k B0+B1 z'\ 
et par le fait que le premier coefficient du filtre BO est egal k 
l/(l+B.min(Ga,l)), et le deuxidme coefficient du filtre Bl est egal k 
fi.min(Ga,l)/(l+B.min(Ga;l)), ob B est un nombre reel de valeur 
absolue inferieure k 1, Ga est le gain a long terme et min(Ga,l) 
designe la valeur minimale entre Ga et 1. 

7- Procede selon Tune des revendications precedentes, 
caract<Sris6 par le fait qu'on effectue Textraction du mot d'excitation k 
long terme en utilisant un premier filtre de ponderation perceptuelle 
(FPP1) comportant un premier filtre de ponderation formantique, par 
le fait qu'on effectue Textraction du mot d'excitation k court terme en 
utilisant le premier filtre de ponderation perceptuelle (FPP1) cascade k 
un deuxieme filtre de ponderation perceptuelle (FPP2) comportant un 
deuxidme filtre de ponderation formantique, et par le fait que le 
denominateur de la fonction de transfert du premier filtre de 
ponderation formantique est egal au numerateur du deuxieme filtre de 
ponderation formantique. 

8- Procede selon la revendication 7 prise en combinaison avec 
Tune des revendications 4 k 6, caracterise par le fait qu'il comporte 
une mise k jour de retat des deux filtres de ponderation perceptuelle 
avec le mot d'excitation k court terme filtre par ledit filtre d'ordre 1. 

9- Dispositif d'encodage de la parole a bande eiargie, 
comportant 4 

-des moyens d'echantillonnage aptes k echantillonner la parole 
de fagon k obtenir des trames vocales successives comportant 
chacune un nombre predetermine d'echantillons, 
-des moyens de traitement aptes a chaque trame vocale, k 
determiner des paramfetres d'un modele de prediction lineaire k 
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excitation par code, ces moyens de traitement comportant des 
premiers moyens detraction (MEXTl) -aptes k extraire un 
mot numerique d'excitation k long terme d'un repertoire cod^ 
adaptatif et k calculer un gain k long terme associe, et des 
5 deuxidmes moyens d'extraction (MEXT2) aptes k extraire un 

mot d'excitation k court terme d'un repertoire code fixe et a 
calculer un gain k court terme associe, et 

-des premiers moyens de mise k jour (MAJ) aptes k mettre a 
jour le repertoire code adaptatif a partir du mot d'excitation k 
10 long terme extrait et du mot d'excitation k court terme extrait, 

caracterise par le fait que les premiers moyens de mise k jour 
comportent 

-des premiers moyens de calcul (SM) aptes k sommer le 
produit du mot extrait d'excitation k long terme par le gain k 
15 long terme associe, avec le produit du mot extrait d'excitation 

a court terme par le gain k court terme associe, de fa?on k 
deiivrer un mot numerique sommd, et 

-un filtre passe-bas (FLCT) ayant une frequence de coupure 
superieure au quart de la frequence d'echantillonnage et 
20 inferieure k la moitie de celle-ci, et connecte entre la sortie 

des premiers moyens de calcul et le repertoire code adaptatif 
de fagon a mettre k jour ce repertoire adaptatif avec le mot 
filtre. 

10- Dispositif selon la revendication 9, caracterise par le fait 
25 que le filtre passe-bas (FLCT) est un filtre numerique k r6ponse 

impulsionnelle finie k phase lineaire ayant un ordre au moins egal k 
10. 

11- Dispositif selon la revendication 10, caracterise par le fait 
que la frequence d'echantillonnage est de 16 kHz, et par le fait que le 

30 filtre est un filtre d'ordre 20 ayant une frequence de coupure de 
Tordre de 6 kHz. 
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12-Dispositif selon Tune des revendications 9 a 11, caracteris^ 
par-le fait que les premiers moyens d'extraction comportent un filtre 
numgrique de prediction lineaire (FP), et par le fait que le dispositif 
comporte des deuxiSmes moyens de mise k jour (MAJ2) aptes k 
5 effectuer une mise k jour de T6tat du filtre de prediction lineaire avec 
le mot d' excitation a court terme filtre (Gc') par un filtre dont les 
coefficients dependent de la valeur du gain k long terme, de fafon k 
affaiblir la contribution de l'excitation k court terme lorsque le gain de 
l'excitation k long terme est superieur k un seuil predetermine. 
10 13-Dispositif selon la revendication 12, caractSris6 par le fait 

que le seuil predetermine est egal k 0,8. 

14- Dispositif selon la revendication 13, caracterise par le fait 
que le filtre est un filtre d'ordre 1 et a une fonction de transfert £gale 
a B0+B1 z~\ et par le fait que le premier coefficient BO du filtre est 

15 egal a 1/(1+6. min(Ga, 1)), et le deuxi&me coefficient Bl du filtre est 
egal k fi.min(Ga,l)/(l+B.min(Ga,l)), oil 8 est un nombre reel de valeur 
absolue inferieure k 1, Ga est le gain k long terme et min(Ga,l) 
designe la valeur minimale entre Ga et 1. 

15- Dispositif selon Tune des revendications 9 k 14, caracteris£ 
20 par le fait que les premiers moyens d'extraction comprennent un 

premier filtre de pond6ration perceptuelle (FPP1) comportant un 
premier filtre de pond6ration formantique, par le fait que les 
deuxidmes moyens d'extraction comprennent le premier filtre de 
pond6ration perceptuelle cascade a un deuxi^me filtre de ponderation 
25 perceptuelle (FPP2) comportant un deuxifeme filtre de ponderation 
formantique, et par le fait que le denominateur de la fonction de 
transfert du premier filtre de ponderation formantique est egal au 
numerateur du deuxidme filtre de ponderation formantique. 

16- Dispositif selon la revendication 15 prise en combinaison 
30 avec Tune des revendications 12 k 14, caracterise par le fait que les 

deuxiemes moyens de mise k jour sont aptes k effectuer une mise k 
jour de retat des deux filtres de ponderation perceptuelle avec le mot 
d'excitation k court terme filtre par ledit filtre d'ordre 1. 
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17- TerminaI d'un syst&me de communication sans fil, 
caract6ris6 par le fait qu'il incorpore un dispositif selon Tune des 
revendications 9 & 16. 

18- Terminal selon la~revendication 17, caract6rise par le fait 
5 qu'il forme un telephone mobile cellulaire. 



ABREGE DESCRIPTIF 



Proc€de et dispositif d'encodage de la parole k bande elargie. 

On echantillonne la parole de fa$on a obtenir des trames 
vocales successives comportant chacune un nombre predetermine 
d'echantillons. A chaque trame vocale on determine des parametres 
d'un module de prediction lineaire a excitation par code, ces 
pararndtres comportant un mot numerique d'excitation k long terme Vj 
extrait d'un repertoire code adaptatif DLT et un gain k long terme 
associe Ga, ainsi qu'un mot d'excitation k court terme cj extrait d'un 
repertoire code fixe DCT et un gain k court terme associe Gc. On 
somme SM le produit du mot extrait d'excitation k long terme par le 
gain k long terme associe, avec le produit du mot extrait d'excitation a 
court terme par le gain k court terme associe, on filtre le mot 
numerique somme dans un filtre passe-bas FLCT ayant une frequence 
de coupure superieure au quart de la frequence d'echantillonnage et 
inferieure k la moitie de celle-ci, et on met k jour le repertoire code 
adaptatif avec le mot filtre. 



Reference : figure 2. 
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